期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于瓶颈特征的藏语拉萨话连续语音识别研究
周楠, 赵悦, 李要嫱, 徐晓娜, 才旺拉姆, 吴立成
北京大学学报(自然科学版)    2018, 54 (2): 249-254.   DOI: 10.13209/j.0479-8023.2017.154
摘要906)   HTML1)    PDF(pc) (695KB)(209)    收藏

基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。

相关文章 | 多维度评价 | 评论0